文件内容概述足球视频上下文感知损失函数动作定位视频理解

足球视频中的上下文感知损失函数

1131260足球视频中的上下文感知损失函数0Anthony Cioppa*0列日大学[email protected] Deli`ege*0列日大学[email protected] Giancola*[email protected]沙特...

迁移学习和门控递归单元的足球视频动作分类

标签：足球视频迁移学习门控递归单元视频动作分类深度学习

⃝可在www.sciencedirect.com上在线获取ScienceDirectICTExpress 8（2022）65...接受日期：2021年3月10日2021年3月26日网上发售摘要从足球视频中提取知识有着巨大的应用，如基于上下文的广告，基于内

大规模搜索与上下文感知网络传播和圈长分布细化周期长度优化

标签：大规模搜索与上下文感知网络传播圈长分布细化周期长度优化

670大规模搜索与上下文感知网络传播与圈长分布细化周期长度优化上下文感知和尺度不敏感的时间重复计数张怀东1，徐学苗1，2，3，韩国强1，何胜峰11华南理工2亚热带建筑科学3计算智能与网络空间信息广东省重点实验室...

上下文感知

标签：上下文

上下文感知学习基础，包括上下文的概念，上下文计算及应用，传感器技术，上下文信息模型，安全与个人隐私等。

上下文感知推荐系统在实际应用中的研究与运用

标签：上下文感知推荐玛丽·古赛因学术论文引用学术档案馆评审团成员

面向实际应用的上下文感知推荐系统玛丽·古赛因引用此版本：玛丽·阿尔·戈森用于现实世界应用的上下文感知推荐系统人工智能.巴黎-萨克雷大学，2019年。英语NNT：2019SACLT008。电话：02275811HAL Id：tel-02275811...

足球视频动作分类：结合迁移学习和门控递归单元的方法

标签：迁移学习门控递归单元足球视频分类卷积神经网络时间依赖性

⃝可在www.sciencedirect.com在线获取ScienceDirectICTExpress 8（2022）65...接受日期：2021年3月10日2021年3月26日网上发售摘要从足球视频中提取知识有着巨大的应用，如基于上下文的广告，基于内容

基于双向时序图的对象感知视频字幕

标签：视频字幕生成对象感知双向时序图时空表示自动化字幕

生成精确、细粒度的字幕不仅需要理解视频的全局内容，还需要捕捉对象的详细信息。同时，视频表示对生成的字幕的质量有很大的影响。因此，重要的是视频字幕捕捉显着的对象与他们的详细的时间动态，并表示他们使用有...

学习重构动作和共现特征以进行时间动作定位

标签：时间动作定位动作特征和共现特征动作定位性能

[email protected]摘要0时间动作定位的主要挑战是从未剪辑视频中检索出各种共现成分（例如上下文和背景）中微妙的人类动作。虽然先前的方法通过设计先进的动作检测器取得了实质性的进展，但它们仍然受到这些共现成分...

360°视频的2D观看方法：学习视频摄影点击，德克萨斯大学奥斯汀分校

标签： 360度视频观看虚拟电影摄影 VR技术全景照片和视频自由探索视觉内容

1使360°视频在2D中可观看：学习视频摄影点击免费观看德克萨斯大学奥斯汀分校摘要360°视频要求人类观看者在观看视频时主动控制看“哪里”。虽然它提供了视觉内容的更沉浸式体验，但它也为观看者带来了额外的负担;...

视频域自适应中的跨模态对比特征学习

标签：跨模态对比特征学习视频域自适应多模态信息统一框架动作识别基准数据集

112用于视频域自适应的跨模态对比特征学习金东铉1，蔡怡萱2，庄冰冰2，向宇2斯坦·斯科拉罗夫1，凯特·萨彦科1，3，曼莫汉·钱德拉克21波士顿大学、2NEC Labs America、3MIT-IBM Watson AI Lab{donhk，sclaroff，...

"大规模动作计数数据集及基于密度图回归的重复动作计数方法研究

标签：重复动作计数长视频数据集动作周期标注密度图回归方法性能优于最先进方法

现有的方法集中于在短视频中执行重复动作计数，这对于在更现实的场景中处理较长的视频是困难的。在数据驱动的时代，这种泛化能力的下降主要归因于缺乏长视频数据集。为了补充这一优势，我们引入了一个新的大规模重复

视频字幕的任务驱动动态融合

标签：动态融合视频描述多通道特征任务驱动自适应融合

1任务驱动的动态融合：减少视频描述中的歧义Xishan Zhang12，Yongdong Zhang12，Yongdong Zhang 12，Dongming Zhang1，Jintao Li1，and Qi Tian31中国科学院计算技术研究所，中国北京2中国科学院大学，中国3德克萨斯...

视频片段顺序预测的自我监督时空学习技术

标签：视频片段顺序预测无监督方法的改进

我们的方法可以通过预测视频中混洗剪辑的顺序来学习视频的时空视频的类别是不需要的，这使得我们的技术有可能利用无限的未注释的视频。存在使用帧的相关工作，而与帧相比，剪辑更符合视频动态。剪辑可以帮助减少命令...

动态层跳过算法在动作识别中的应用

标签：件的5个标签动作识别算法计算资源分配长视频处理提前终止策略

用于有效动作识别的动态层跳过钟贤善1黄在东2钟焕门3韩宝亨1首尔国立大学2麻省理工学院3Kakao Brain{sunutf，bhhan}@ [email protected]摘要分析视频内容的挑战之一（例如，动作）是高计算成本...

高分辨率视频帧内插的IM-Net

标签：高分辨率视频帧内插 IM-Net网络研发中心深度学习方法视频帧插值问题

2398高分辨率视频帧内插的IM-NetTomer Peleg Pablo Szekely Doron Sabo Omry Sendik三星以色列研发中心{tomer.peleg，pablo.sz，doron.sabo，omry.sendik}@ samsung.com摘要视频帧内插是视频处理领域中一个研究已久...

基于任务的注意转移模型在自我中心视频中的凝视预测

标签： 5个标签注意转移模型基于深度神经网络自我中心视频注视预测

我们提出了一个新的计算模型，在以自我为中心的视频的凝视预测，通过探索模式的时间转移的凝视固定（注意力转移），是依赖于以自我为中心的操纵任务。我们的假设是，如何以某种方式完成任务的高层次的背景下有很强...

"2D和3D人体感知的深度多任务架构

标签：深度多任务架构 2D和3D人体感知单目图像识别和重建 2D和3D姿态估计多任务损失训练

1用于集成2D和3D人体感知的深度多任务架构Alin-Ionut Popa2分，Mihai Zanfir2分，Cristian Sminchisescu1分，2分alin. imar.ro，mihai. imar.rocristian. math.lth.se1隆德大学2罗马尼亚科学院摘要我们提出了一个...

深度分组模型与统一感知解析

标签：统一感知解析模型深度分组模型感知分组过程图像分割网络可解释性

140530用于统一感知解析的深度分组模型0李志恒 1 鲍文轩 2 * 郑佳阳 1 徐晨亮 101 罗切斯特大学 2 清华大学0{ zhiheng.li,jiayang.zheng,chenliang.xu } @rochester.edu [email protected]....

基于负向感知的图像-文本匹配框架

标签：基于负向感知的图像-文本匹配框架相似性衡量不匹配线索负向感知注意力

156610基于负向感知的图像-文本匹配框架0张坤1，郑东毛1*，王权2，张永东101 中国科学技术大学，中国合肥; 2 中国邮电大学，可信分布式计算与服务教育部重点实验室，中国北京[email protected]，{zdmao,...

改进的有监督视频摘要方法及其应用

一种改进的有监督视频摘要艾迪安·沙尔吉1[000000320051334]、阿里·博尔吉1、李...自动总结视频已经成为浏览、搜索和索引视觉内容的实质性需要。本文是在静脉的监督视频摘要使用顺序决定点过程（SeqDPPs），模型的多

跨类别视频亮点检测的基于集合学习方法

标签： 7970 摘要

为了以数据驱动的方式实现这个目标，人们可能经常面临这样的情况，其中在实践中使用的目标视频类别上没有可用的高光注释，而对另一个视频类别（称为源视频类别）的监督是可实现的。在这种情况下，可以通过将从源...

"视频压缩中的自适应顺序搜索和切线加权权衡算法

Journalof King Saud University沙特国王大学沙特国王大学学报...接受日期：2016年2016年8月2日在线发布摘要运动估计和补偿在视频压缩中起着重要的作用，可以减少输入视频的时间冗余。各种块搜索模式已被开发用

基于弱监督多尺度属性特定定位

标签：行人属性识别属性定位特征金字塔架构多级深度监督实验结果分析

4997基于弱监督多尺度属性特定定位唐楚峰1卢胜2张兆祥3胡小林11智能技术与系统国家重点实验室，清华大学北京国家信息科学技术研究中心计算机科学与技术系人工智能研究所2北京航空航天大学软件学院3中国科学{tcf18@...

语义感知的手势生成方法SEEG的研究及其在语义表达中的优越性

标签：语义赋能语音手势生成实用任务语义挖掘语义感知

10473SEEG：语义赋能的协同语音手势生成梁远志*1、2、冯倩玉3、朱林超2、李虎1、潘攀1、杨毅31阿里巴巴集团达摩院2ReLER Lab，AAII，悉尼科技大学3浙江大学...目前的研究主要集中在手势与语音节奏的匹配上，这使得手势

深度回归跟踪器的收缩损失及性能评估

标签：五个标签可以总结为收缩损失回归网络目标跟踪数据不平衡

具有收缩损失的Xiankai Lu1，3， Chao Ma2，Bingbing Ni1，4，Xiaokang Yang1，4，Ian Reid2，and Ming-HsuanYang5，61上海交通大学2阿德莱德大学3Inception人工智能4SJTU-UCLA机器感知与推理联合中心5加州大学默塞...

视频摘要中的视觉语言嵌入方法及其在提高摘要能力方面的效果

普卢默马修布朗<$斯维特拉娜Lazebnik伊利诺伊大学香槟分校（University of Illinois at Urbana Champaign）@ www. [email protected]摘要本文讨论了视频摘要，或将原始视频提取为较短形式，同时仍...

Siamese跟踪器模型更新的学习方法：通过使用UpdateNet-SiamFC替代手动制作的更新函数来预测新的目标模板，...

标签： Siamese方法暹罗足球俱乐部更新成功率3.9%

4010学习Siamese跟踪器的模型更新Lichao Zhang1，Abel Gonzalez-Garcia1，Joost van de Weijer1，Martin Danelljan2，Fahad ShahbazKhan3，41西班牙... liu.se摘要Siamese方法通过从当前帧中提取外观模板来定位下

基于骨架序列的三维动作识别方法的研究

标签：三维动作识别骨架序列表示方法深度神经网络时空特征学习动作识别

3288一种用于三维动作识别的骨架序列表示方法柯秋红1，穆罕默德·本那蒙1，安森健1，费道斯·索赫尔2，法里德·布赛义德11西澳大利亚大学2默多克大学qiuhong.ke邮件research.uwa.edu.au{mohammed.bennamoun，senjian...

未来之路：大模型技术在自动驾驶的应用与影响

标签：自动驾驶大模型 Transformer

文中首先概述了大模型技术的发展历程，自动驾驶模型的迭代路径，以及大模型在自动驾驶行业中的作用。接着，详细介绍了大模型的基本定义、基础功能和关键技术，特别是Transformer注意力机制。文章还探讨了大模型在...

深度神经网络（DNNs）基本概念、核心算法原理、具体操作步骤 Understanding Deep Neural Networks

标签：自然语言处理人工智能语言模型

深度神经网络（DNNs）是一个由多个层组成的递归函数，每一层由多个神经元组成，每个神经元接收前一层所有神经元的输出，根据输入数据对输出进行计算并传递给下一层神经元，最终完成预测或分类任务。DNNs的学习能力强...